版本迭代的最終篇,接續前2篇對YOLO迭代的基礎介紹,接著要說明的是由v7到v9的演變,那就開始吧!
主要分成兩個方面去優化:模型架構優化和訓練過程優化
v7的測試對比。 YOLO v7 Paper
利用了與YOLOv5類似的程式碼,但採用了新的結構,其中使用相同的程式碼來支援分類、實例分割和物件偵測等任務類型。模型仍然使用相同的YOLO v5 YAML格式初始化,資料集格式也保持不變。
v8相較於前幾代的優勢:
使用了Programmable Gradient Information, PGI 和一種新的輕量架構 — Generalized Efficient Layer Aggregation Network, GELAN 來處理深度神經網路中的訊息損失問題。
v9的優勢:
MS COCO 資料集上即時目標偵測器的比較。圖片來源:YOLO v9 Paper
在這個YOLO的版本迭代的系列中,雖然內容較於枯燥乏味,筆者也花了大量時間去閱讀不同的文章和論文。通過理解了YOLO演算法的各個版本,對於YOLO的原理以及改動的項目有了更深度的理解。學習這些不僅對YOLO的技術有了更深入的了解,還學習到了很多視覺領域的最新研究和發展。希望這個系列能幫助讀者們更好的理解和應用YOLO技術,並激發大家對物件偵測的技術有更多的興趣。
接著要來說說YOLO是怎麼運作的,感謝各位的觀看,我們下篇見。